在进行 socket 编程之前,你要有一些计算机网络的知识,了解 TCP/UDP 、客户端服务器模型。
Windows Client 端
Windows socket 编程 client 端 大致如下:
1 | char buffer[buffer_size] = { 0 }; //接收数据的缓存 |
WSADATA 结构体
该结构体定义了与 Winsock 库相关的一些信息。在 Windows 上使用 Socket 编程时,必须先调用 WSAStartup()
函数初始化 Winsock 库,而 WSADATA
结构体则是这个初始化过程的一部分。
WSADATA
结构体在 winsock2.h
头文件中定义,通常包含以下信息:
1 | typedef struct _WSADATA { |
WSAStartup() 函数
用于初始化 Winsock 库并准备网络通信的环境。在 Windows 上进行网络编程时,必须先调用 WSAStartup() 才能使用任何与网络相关的功能(如套接字、连接、数据传输等)。
1 | int WSAStartup( |
WSAStartup() 为我们应用程序提供了使用 Windows 套接字的能力,会为应用程序提供所需的 Winsock 资源,并允许操作系统在程序退出时释放这些资源(通过 WSACleanup())。
返回值:
如果函数调用成功,返回值为 0。
如果函数调用失败,返回值是一个错误代码,表示初始化失败的原因。可以通过调用 WSAGetLastError() 获取详细的错误信息。(WSAGetLastError() 用于获取上一次 Winsock 操作的错误码。)
使用示例:
1 | int iResult = WSAStartup(MAKEWORD(2, 2), &wsaData); |
MAKEWORD(2, 2)
是一个宏,用于将两个 BYTE(字节)组合成一个 WORD(字,通常是 16 位的整数)。在 Windows 编程中,MAKEWORD 常用于将两个字节值合并为一个 16 位的数值,通常用于指定版本号或类似的参数。
- 在 MAKEWORD(2, 2) 中,它将 2 和 2 合并,得到表示 “2.2” 版本号的 WORD 值。
- 在 WSAStartup() 中,MAKEWORD(2, 2) 表示请求使用 Winsock 2.2 版本。
MAKEWORD 宏定义:
1 |
|
- low:低字节(低 8 位),表示低位。
- high:高字节(高 8 位),表示高位。
MAKEWORD 的位运算 (了解,不重要可跳过)
(DWORD_PTR)(a)
和 **(DWORD_PTR)(b)
**:- 这部分将
a
和b
强制转换为DWORD_PTR
类型(通常是unsigned int
,在 64 位系统上为unsigned long long
,在 32 位系统上为unsigned int
)。 - 这个转换的目的是确保
a
和b
被当作一个整数来处理,方便进行位操作。
- 这部分将
(DWORD_PTR)(a) & 0xff
和 **(DWORD_PTR)(b) & 0xff
**:- 这里使用了 **按位与运算符
&
**:0xff
是一个 8 位的掩码,二进制表示为11111111
。- 按位与运算
&
用于保留a
和b
中的最低 8 位(即低字节)。即使a
或b
是更大的类型(比如DWORD_PTR
,它的大小可能是 32 位或 64 位),通过& 0xff
运算后,它们会被限制在 8 位范围内。 - 举个例子,如果
a
的值是0x12345678
(32 位整数),a & 0xff
会返回0x78
,即最后一个字节的值。
- 这里使用了 **按位与运算符
(BYTE)(((DWORD_PTR)(a)) & 0xff)
和 **(BYTE)(((DWORD_PTR)(b)) & 0xff)
**:- 这两部分将前面的结果转换为
BYTE
类型。BYTE
是 8 位的类型,确保结果是 8 位整数,去除多余的位数。
- 这两部分将前面的结果转换为
**
(WORD)((BYTE)(((DWORD_PTR)(b)) & 0xff)) << 8
**:b
被处理成一个字节后,通过 左移操作<< 8
将它移到高字节的位置(16 位整数的高 8 位)。- 具体来说,左移 8 位的效果是将字节
b
提高 8 位,使其成为 16 位整数的高字节。例如,如果b = 0x34
,那么左移后就是0x3400
。
**
((BYTE)(((DWORD_PTR)(a)) & 0xff)) | ((WORD)((BYTE)(((DWORD_PTR)(b)) & 0xff))) << 8
**:- 按位或运算符
|
用于将a
和b
合并成一个 16 位的整数。a
是低字节,b << 8
是高字节,二者按位或运算合并成一个 16 位整数。- 举个例子:如果
a = 0x12
和b = 0x34
,那么a | (b << 8)
的结果是0x3412
。
- 按位或运算符
**
(WORD)
**:- 最后,通过强制类型转换将结果转换为
WORD
类型。WORD
是 16 位的整数类型,确保最终结果符合预期的类型。
- 最后,通过强制类型转换将结果转换为
SOCKET 以及 socket() 函数
SOCKET
是 Windows 套接字编程中用于表示一个网络套接字的类型。它是一个句柄(或标识符),用来标识一个网络连接或通信通道。
SOCKET
本质上是一个整数类型(通常是unsigned int
),用于表示一个网络连接。
socket()
函数是创建一个套接字(socket)的函数。它通过指定地址族、套接字类型和协议类型来创建一个网络通信的通道。
1 | SOCKET socket(int af, int type, int protocol); |
**af
(地址族)**:指定套接字所使用的地址族,决定了套接字能够处理的数据类型(如 IPv4、IPv6 等)。
常用的值:
AF_INET
:IPv4 地址族,表示使用 IPv4 地址进行通信。AF_INET6
:IPv6 地址族,表示使用 IPv6 地址进行通信。AF_UNIX
:Unix 域套接字,通常用于同一台机器上的进程间通信。
**type
(套接字类型)**:指定套接字的类型,决定了数据的传输方式。
常用的值:
SOCK_STREAM
:流套接字,表示面向连接的 TCP 协议。适用于可靠的、连接导向的通信(如 HTTP、FTP)。SOCK_DGRAM
:数据报套接字,表示无连接的 UDP 协议。适用于不保证可靠性的、无连接的通信(如 DNS 查询、视频流)。SOCK_RAW
:原始套接字,允许直接访问网络层协议(通常是 ICMP 或自定义协议)。这种套接字用于较底层的网络操作,常见于网络工具。
**protocol
(协议)**:指定所用的协议,通常与 type
配合使用,决定了套接字的协议标准。
常用的值:
IPPROTO_TCP
:表示 TCP 协议。一般与SOCK_STREAM
搭配使用。IPPROTO_UDP
:表示 UDP 协议。一般与SOCK_DGRAM
搭配使用。IPPROTO_IP
:表示通用的 IP 协议,通常可以与SOCK_RAW
配合使用。
socket() 返回值:
- 成功时返回:如果套接字创建成功,
socket()
函数返回一个SOCKET
类型的值,这个值是一个非负整数,表示新创建的套接字的句柄。 - 失败时返回:如果创建套接字失败,返回值是
INVALID_SOCKET
,这通常是一个特殊值(在 Windows 中通常为-1
)。(#define INVALID_SOCKET (SOCKET)(~0)
)
sockaddr_in
sockaddr_in 是一个结构体,用于存储 IPv4 地址和端口信息,通常用于 TCP 或 UDP 套接字编程中。它是 sockaddr 结构的一个变种,专门用于 IPv4。
1 | // |
1 | serverAddr.sin_family = AF_INET; // internetwork: UDP, TCP, etc. |
inet_pton() 函数
该函数用于将标准文本类型的 IPv4 & IPv6 地址转换成二进制形式。
in_addr struct
in_addr 结构体代表了一个 IPv4 地址
1 | in_addr serverIP; |
1 | // in_addr 定义: |
memcpy()
memcpy(&(serverAddr.sin_addr), &serverIP, sizeof(serverIP));
这行代码使用memcpy函数将serverIP的内容复制到serverAddr.sin_addr中。memcpy函数接受三个参数:目标地址、源地址、以及要复制的字节数。
connect() 函数
connect() 函数是用来建立与远程服务器连接的标准函数,通常在客户端程序中使用。它的作用是向指定的服务器地址发起连接请求,并完成三次握手过程。如果连接成功,connect() 函数返回值为 0,否则返回一个错误代码。
connect() 是一个阻塞函数(在默认情况下),即在连接建立之前,它会阻塞调用线程直到连接成功或失败(返回错误)。
1 | iResult = connect(clientSocket, (SOCKADDR*)&serverAddr, sizeof(serverAddr)); |
(SOCKADDR*)&serverAddr:这是一个类型转换,将serverAddr的地址转换为一个指向SOCKADDR结构体的指针。serverAddr是一个sockaddr_in类型的变量,它包含了服务器的地址信息(如IP地址和端口号)。sockaddr_in是sockaddr的一个特定于IPv4的实现,这种转换是必要的,因为connect()函数的第二个参数是一个指向SOCKADDR的指针,而SOCKADDR是一个通用的地址结构体,sockaddr_in是它的一个具体实现。
send() 函数
1 | int send( |
flags: 控制发送行为的标志。通常是以下几种:
- 0: 默认行为,数据将尽可能一次性发送。
- MSG_OOB: 发送带外数据。
- MSG_DONTROUTE: 不使用路由表(直接发送到目标地址)。
- MSG_MORE: 发送更多数据,通常与大数据流一起使用。
- MSG_NOSIGNAL: 不触发 SIGPIPE 信号(适用于一些 Unix 系统,Windows 中该标志没有实际影响)。
除了 send() 函数用来发送数据以外,还有 sendto() UDP 的发送数据,以及 WSASend() 函数, 是 send() 的扩展(异步)。
recv() 函数
1 | int recv( |
int iRecvResult = recv(clientSocket, recvbuf, BUFFER_SIZE - 1, 0);
BUFFER_SIZE - 1
是为了确保缓冲区末尾有足够的空间来存储 空字符(\0),以确保接收到的数据能够作为一个有效的 C 字符串使用。recv() 不会自动为接收到的数据添加 \0(空字符),因此,如果期望将接收到的数据当作字符串处理,就必须在缓冲区的末尾手动添加 \0。如果只是把接收的数据当作二进制数据处理,那么 BUFFER_SIZE - 1
大可不必。
返回值:
recvResult > 0:表示成功接收了数据,返回的是接收到的字节数。
recvResult == 0:表示连接已关闭。通常,这意味着对方已经关闭了连接,不能再发送数据。如果服务器关闭了连接,客户端调用 recv() 时会返回 0,表示连接被关闭。
recvResult == SOCKET_ERROR:表示发生了错误,调用 recv() 函数失败。
长期不调用 recv() 函数可能会导致数据丢失
每个套接字(无论是发送端还是接收端)都有 发送缓冲区 和 接收缓冲区。这两个缓冲区由操作系统的 TCP/IP 协议栈管理。
- 接收缓冲区:用于临时存储接收到的网络数据,直到应用程序调用
recv()
将数据读取出来。 - 发送缓冲区:用于存储待发送的数据,直到 TCP 协议栈将其传输到网络。
如果应用程序不及时调用 recv()
来读取数据,接收缓冲区中的数据就会积压。
接收缓冲区满:当接收缓冲区满了,TCP 会根据流量控制(Flow Control)机制采取措施,确保不会接收到过多的数据,导致丢失。
流量控制:TCP 会通过接收方的 接收窗口(receive window) 通知发送方接收缓冲区的剩余空间。如果接收方的接收缓冲区已满,接收窗口大小会变为 0,这就意味着发送方无法继续发送数据,直到接收方的缓冲区有足够的空间来接收新数据。
这时,发送方会减缓发送速率,甚至暂停发送,直到接收方的接收缓冲区有空闲空间为止。
如果应用程序 长时间不调用 recv()
来读取接收到的数据,并且接收缓冲区已满:
- 在 TCP 保证可靠交付 的情况下,TCP 协议栈会通过调整接收窗口来控制发送方的发送速率。如果缓冲区满了,发送方会暂停发送,直到接收方读取部分数据并释放缓冲区空间。
- 然而,如果 接收缓冲区仍然没有被及时读取,并且长时间保持满的状态,某些系统会发生 缓冲区溢出 或者 丢失数据。具体取决于操作系统的实现。
Windows Server 端
1 | //server 端 |
server 端和 client 端大致相同,但也有些许差别。
server 端要有一个一直打开的欢迎套接字(serverSocket),等待来自 client 端的连接。server 端比 client 多了绑定套接字 bind() 和 监听操作 listen()。client 使用 connect() 来连接 server 端的欢迎套接字,server 端使用 accept() 接受来自 client 端的连接,并返回一个新的套接字,用来和该 client 端交换数据。bind()
函数和 accept()
函数的参数在代码中都很简单明了,这里就不多介绍。
bind() 操作:将一个本地的套接字地址(包括 IP 地址和端口号)与一个套接字绑定,确保服务器能够在一个特定的端口上监听连接请求。服务器需要绑定到某个具体的端口号,以便客户端能够通过该端口访问服务器。绑定后,操作系统会知道要将来自客户端的请求通过该端口路由到服务器。(在 client 端,操作系统会为客户端分配一个临时端口,用于与服务器进行通信。因此,客户端不需要使用 bind() 来指定本地的端口号。)
listen() 操作:listen() 函数告诉操作系统,服务器套接字准备好接受客户端的连接请求。它实际上是使套接字处于监听状态,等待客户端发起连接。
1 |
|
在代码中,listen()
函数的第二个参数 SOMAXCONN
是一个宏定义 #define SOMAXCONN 0x7fffffff
,一个 16进制数,0x7fffffff
只是一个理论值,实际情况中可能有所不同。我们也可以自己指定 backlog
这个值,但不能超过一个最大限制,一旦超过这个最大限制,操作系统会自动调整为最大限制的值,至于这个最大限制是多少,不同的操作系统中可能会不同。backlog
值过小可能导致连接请求被拒绝(连接队列已满),如果设置得太大,可能会消耗过多的系统资源(端口号在一台机器上是有限的资源)。对于高负载的服务器,backlog
可能需要更高的值。
server 端可以接受多个 client 端的连接,欢迎套接字的作用就是监听端口,等待来自客户端的连接,并为每一个 client 端单独创建一个套接字与之进行通信。在上面的示例代码中,仅接受一个 client 端的连接,因为只创建了一个 clientSocket。
server 端和 client 端可以在同一台电脑上运行,这样就实现了同一台机器上两个进程之间的通信,client 端 使用 127.0.0.1
IP 地址连接 server 端。
server 端 和 client 端也可以在不同的主机上运行,如果在同一个局域网中,client 端就使用运行 server 端进程的主机的局域网 IP 地址进行连接。如果 server 端处于公共的网络环境中,client 端就使用 server 端主机的公网 IP 地址进行连接。
下面这段 client 代码用来连接以上 server 端:
1 | //client 端 |
运行:server端 监听 12345 端口,client 端连接本地的 12345 端口不断地从命令行接收 message,并发送给 server 端,server 每次收到消息 都只发送 “Hello from server. 你好我是服务器端。”